Design and Implementation of a Spell Checker for Hausa Language (Étude et conception d'un correcteur orthographique pour la langue haoussa) [in French]
نویسندگان
چکیده
In this paper, we have designed, implemented and tested a spell corrector for the Hausa language which is the second most spoken language in Africa and do not yet have processing tools. This study is a contribution to the automatic processing of the Hausa language. We used existing techniques for other languages and adapted them to the special case of the Hausa language. The corrector designed operates essentially on Mijinguini’s dictionary and characteristics of the Hausa alphabet. After a careful study of the existing spell checking and correcting techniques and the state of art in the computerization o f the Hausa language, we opted for the data structures trie and hash table to represent the dictionary. We used the edit distance and the specificities of the Hausa alphabet to detect and correct spelling errors. The implementation of the spell corrector has been made on a special editor developed for that purpose (LyTexEditor) but also as an extension (add-on) for OpenOffice.org. A comparison was made on the performance of the two data structures used. Mots-clés: Traitement automatique des langues, informatisation du haoussa, langues africaines, correcteur orthographique.
منابع مشابه
A spell-checker and thesaurus for Bambara (Bamanankan) (Un vérificateur orthographique pour la langue bambara) [in French]
A spell-checker and thesaurus for the Bambara language (Bamanankan), based on an electronic version of a dictionary of Bambara, Bamadaba, ported to a standard spell-check engine, Hunspell, and made available (through their respective web sites) for Libre Office, Open Office, Neo Office, Mozilla Firefox and Thunderbird, as well as Adobe Indesign and other software using the Hunspell engine. The ...
متن کاملRègles de formation des noms en hausa (Formation rules of names in Hausa) [in French]
RÉSUMÉ____________________________________________________________________________________________________________ Dans la perspective du traitement automatique des langues africaines, nous avons décrit quelques caractéristiques du fonctionnement lexical du haoussa. Nous nous sommes intéressés aux règles de formation de mots à partir des racines où une racine est un mot auquel on ajoute quelqu...
متن کاملAdaptation d'un système de reconnaissance d'entités nommées pour le français à l'anglais à moindre coût (Adapting a French Named Entity Recognition System to English with Minimal Costs) [in French]
RÉSUMÉ La portabilité entre les langues des systèmes de reconnaissance d’entités nommées est coûteuse en termes de temps et de connaissances linguistiques requises. L’adaptation des systèmes symboliques souffrent du coût de développement de nouveaux lexiques et de la mise à jour des règles contextuelles. D’un autre côté, l’adaptation des systèmes statistiques se heurtent au problème du coût de ...
متن کاملVers une inversion acoustico-articulatoire d'un locuteur étranger (Toward an acoustic to articulatory inversion of a foreign speaker) [in French]
L’inversion acoustico-articulatoire consiste à déterminer la forme du conduit bucal à partir d’un enregistrement audio de parole. Il s’agit plus précisément de reconstruire la trajectoire de divers points situés sur la langue, les lèvres et la machoire (et éventuellement le palais) à partir du signal acoustique. Intéressante en tant que telle pour l’étude des processus de production de la parol...
متن کاملHow To Visualize Time, Tense And Aspect?
Nous allons dEcrire ci-dessous une extension d'un syst~me interactif de gEnEration de phrases. Apr~s une description de SWIM,-acronyme de See What I Mean ?-nous allons discuter la fa~on dont on communique au syst~me des notions relatives au temps et ~t l'aspect. Avec SWIM nous poursuivons trois objectifs : (a) assister un Etudiant dans rapprentissage d'une langue, plus prdcisEment aider l'appre...
متن کامل